Analise de Informações Aereas

1- Introdução

Análise do Sistema Aeroviário Global (2000-2024)

Introdução

Essa análise é baseada em dados gerados por viagens de avião entre os anos de 2000 e 2024, abrangendo todos os aeroportos do mundo. Esses dados são cruciais para analisar tendências no transporte aéreo e os impactos de eventos globais no sistema aeroviário.

Tendências de Viagens e Impactos Globais

O setor aeroviário tem crescido ao longo dos anos, sendo esse um fator essencial para as empresas de aviação ao gerar relatórios e insights. Esses dados ajudam tanto na previsão do crescimento do número de viagens com o passar dos anos quanto na identificação de alterações causadas por eventos em diferentes países.

Exemplos de Impactos:
  • Crises Econômicas: Recessões globais podem reduzir a demanda por viagens, o que afeta diretamente a taxa de ocupação dos voos.
  • Pandemias: Como visto com a COVID-19, a demanda por viagens despencou, alterando drasticamente o comportamento de passageiros e companhias.
  • Eventos Climáticos e Políticos: Fenômenos naturais, como furacões, ou instabilidades políticas podem influenciar rotas e a frequência de voos.
Dados da ANAC

A base de dados da ANAC (Agência Nacional de Aviação Civil) fornece informações detalhadas sobre:

  • Quantidade de passageiros
  • Carga e mala postal transportadas
  • Distância voada
  • Combustível consumido
  • Etapas de voo e empresa aérea

Essas informações podem ser usadas para calcular indicadores importantes para o setor de aviação, como demanda, oferta, participação de mercado e taxa de ocupação de aeronaves.

Conclusão

Esses dados são vitais para o setor de aviação e permitem a identificação de tendências, impactos de eventos globais e a otimização da oferta de serviços aéreos. Para empresas de aviação, ter acesso a essas métricas é crucial para melhorar o planejamento estratégico, prever o crescimento e se preparar para possíveis impactos futuros.

2- Pacotes Necessários

library(plotly)

library(dplyr)

library(tidyr)

library(DT)

3- Import e Preparação

Estrutura dos dados

Os dados estão distribuidos da seguinte forma:

data <- read.csv("C:/Users/Lucas Henrique/Desktop/UFRPE/Comp. Analise de Dados/Dados_Estatisticos.csv",sep = ";", header=TRUE)

dim(data)
## [1] 1018628      38

Temos 1.018.628 Linhas e 38 Colunas na nossa base.

Seleção das colunas relevantes

Nós iremos realizar algumas alterações para que possamos utilizar a base para nossas análises. Inicialmente manteremos somente as seguintes colunas:

  • 4 AEROPORTO_DE_ORIGEM_SIGLA: Sigla (código) do aeroporto de origem.
  • 5 AEROPORTO_DE_ORIGEM_NOME: Nome completo do aeroporto de origem.
  • 6 AEROPORTO_DE_ORIGEM_UF: Unidade Federativa (estado) do aeroporto de origem.
  • 7 AEROPORTO_DE_ORIGEM_REGIAO: Região geográfica do aeroporto de origem.
  • 8 AEROPORTO_DE_ORIGEM_PAIS: País onde está localizado o aeroporto de origem.
  • 10 AEROPORTO_DE_DESTINO_SIGLA: Sigla (código) do aeroporto de destino.
  • 12 AEROPORTO_DE_DESTINO_UF: Unidade Federativa (estado) do aeroporto de destino.
  • 13 AEROPORTO_DE_DESTINO_REGIAO: Região geográfica do aeroporto de destino.
  • 14 AEROPORTO_DE_DESTINO_PAIS: País onde está localizado o aeroporto de destino.
  • 16 NATUREZA: Natureza do voo (pode indicar se é doméstico, internacional, etc.).
  • 20 CARGA_PAGA_KG: Quantidade de carga paga transportada (em quilogramas).
  • 21 CARGA_GRATIS_KG: Quantidade de carga transportada gratuitamente (em quilogramas).

Tratamento de valores faltantes

Após selecionar as colunas que serão utilizadas, vamos checá-las e retirar os valores que são vazios ou NA, para evitar inconsistências.

data_filt <- data_filt %>% filter(
  !is.na(ANO) & ANO != "" &
    !is.na(MES) & MES != "" &
    !is.na(AEROPORTO_DE_ORIGEM_NOME) & AEROPORTO_DE_ORIGEM_NOME != "" &
    !is.na(AEROPORTO_DE_DESTINO_NOME) & AEROPORTO_DE_DESTINO_NOME != "" &
    !is.na(PASSAGEIROS_PAGOS) &
    !is.na(PASSAGEIROS_GRATIS) &
    AEROPORTO_DE_DESTINO_PAIS == "BRASIL"
)

Criação da coluna PASSAGEIROS_TOTAIS

Por último, vamos realizar a unificação das colunas “Passageiros Gratis” e “Passageiros Pagos”, gerando a coluna resultante PASSAGEIROS_TOTAIS, referente ao total de passageiros por voo, que será um dado importante na nossa análise.

data_filt$PASSAGEIROS_TOTAIS = data_filt$PASSAGEIROS_GRATIS + data_filt$PASSAGEIROS_PAGOS

Visualização do dataset final

Assim, temos a disposição final do nosso dataset após as operações iniciais de pré-processamento.

datatable(head(data_filt,20), options = list(scrollX = TRUE))

4- Analise dos dados

1 - Geral

2 - 2023,2020 e 2019

3 - Brasil 2014 e 2016

12 de jun. de 2014 – 13 de jul. de 2014

5 de agosto de 2016 – 21 de agosto de 2016

5- Conclusão